我们考虑了有监督学习的神经颂歌和最佳控制观点,并以$ \ ell^1 $ -Control处罚,而不是仅将最终成本(\ emph {经验风险})最小化,我们将此成本整合在整个时间范围。我们证明,任何最佳控制(以此为代价)都超出了一些积极的停止时间。当在离散时间上下文中看到时,此结果需要用于关联残留神经网络参数的\ emph {有序}稀疏模式:从某种意义上说,这些参数都是$ 0 $以外的一层。此外,我们为时间范围提供了经验风险的多项式稳定性估计。对于具有$ \ ell^1 $ - penalties的非滑动力和功能,可以看作是\ emph {收费公路属性},并且在数据上没有任何较小的假设,这两个假设在文献中都是新的。
translated by 谷歌翻译